智能论文笔记

Few-shot Classification with Hypersphere Modeling of Prototypes

Ning Ding , Yulin Chen , Ganqu Cui , Xiaobin Wang , Hai-Tao Zheng , Zhiyuan Liu , Pengjun Xie

分类：机器学习 | 自然语言处理 | 计算机视觉

2022-11-10

Metric-based meta-learning is one of the de facto standards in few-shot learning. It composes of representation learning and metrics calculation designs. Previous works construct class representations in different ways, varying from mean output embedding to covariance and distributions. However, using embeddings in space lacks expressivity and cannot capture class information robustly, while statistical complex modeling poses difficulty to metric designs. In this work, we use tensor fields (``areas'') to model classes from the geometrical perspective for few-shot learning. We present a simple and effective method, dubbed hypersphere prototypes (HyperProto), where class information is represented by hyperspheres with dynamic sizes with two sets of learnable parameters: the hypersphere's center and the radius. Extending from points to areas, hyperspheres are much more expressive than embeddings. Moreover, it is more convenient to perform metric-based classification with hypersphere prototypes than statistical modeling, as we only need to calculate the distance from a data point to the surface of the hypersphere. Following this idea, we also develop two variants of prototypes under other measurements. Extensive experiments and analysis on few-shot learning tasks across NLP and CV and comparison with 20+ competitive baselines demonstrate the effectiveness of our approach.

translated by 谷歌翻译

Federated Spatial Reuse Optimization in Next-Generation Decentralized IEEE 802.11 WLANs

Francesc Wilhelmi , Jernej Hribar , Selim F. Yilmaz , Emre Ozfatura , Kerem Ozfatura , Ozlem Yildiz , Deniz Gündüz , Hao Chen , Xiaoying Ye , Lizhao You

分类：人工智能 | 机器学习

2022-03-20

随着无线标准的发展，引入了更复杂的功能，以解决吞吐量，延迟，安全性和效率方面的增加。为了释放此类新功能的潜力，目前正在利用人工智能（AI）和机器学习（ML）（ML）来从数据中得出模型和协议，而不是通过手工编程。在本文中，我们探讨了将ML应用于下一代无线局域网（WLAN）的可行性。更具体地说，我们专注于IEEE 802.11AX空间重用（SR）问题，并通过联合学习（FL）模型来预测其性能。在这项工作中概述的FL解决方案集是2021年国际电信联盟（ITU）AI的5G挑战赛的一部分。

translated by 谷歌翻译

Semi-Supervised Adversarial Recognition of Refined Window Structures for Inverse Procedural Façade Modeling

Han Hu , Xinrong Liang , Yulin Ding , Qisen Shang , Bo Xu , Xuming Ge , Min Chen , Ruofei Zhong , Qing Zhu

分类：计算机视觉

2022-01-22

众所周知，深度学习方法是渴望数据的，它需要大量标记的样本。不幸的是，大量的交互式样品标记工作极大地阻碍了深度学习方法的应用，尤其是对于需要异质样本的3D建模任务。为了减轻对FA \ c {C} ADS的3D建模的数据注释的工作，本文提出了一种半监督的对抗识别策略，该策略嵌入了逆程序建模中。从纹理LOD-2（详细级别）模型开始，我们使用经典的卷积神经网络来识别来自图像补丁的类型并估算Windows的参数。然后将窗口类型和参数组装到程序语法中。一个简单的程序引擎是在现有的3D建模软件中构建的，产生了细粒的窗户几何形状。为了从一些标记的样品中获得有用的模型，我们利用生成对抗网络以半监督的方式训练特征提取器。对抗训练策略还可以利用未标记的数据，使训练阶段更加稳定。使用公开可用的FA \ c {C} ADE图像数据集的实验表明，在同一网络结构下，提出的培训策略可以提高分类精度的提高约10％，参数估计提高了50％。此外，在针对具有不同fa \ c {c} ADE样式的不同数据测试时，性能提高更为明显。

translated by 谷歌翻译

OpenPrompt: An Open-source Framework for Prompt-learning

Ning Ding , Shengding Hu , Weilin Zhao , Yulin Chen , Zhiyuan Liu , Hai-Tao Zheng , Maosong Sun

分类：自然语言处理 | 人工智能 | 机器学习

2021-11-03

快速学习已成为现代自然语言处理的新范式，它直接适应培训的语言模型（PLMS）到$ CLOZE $ -Style预测，自回归建模或序列到序列生成，从而导致各种任务的表现。但是，尚未提出及时学习的标准实施框架，以及大多数现有的及时学习码条，通常是不受管制的，仅为特定方案提供有限的实现。由于有许多细节，例如模板策略，初始化策略和语言化策略等，因此需要在快速学习中考虑，从业者面临障碍，以便快速调整所需的迅速学习方法到他们的应用程序。在本文中，我们展示了{OpenPrompt}，一个统一的易于使用的工具包，可以通过PLMS快速学习。 OpenPrompt是一项研究型框架，配备了效率，模块化和可扩展性，其组合性允许自由地将不同的PLMS，任务格式和提示模块组合在统一的范例中。用户可以宽松地部署快速学习框架，并在没有约束的情况下在不同的NLP任务上评估它们的泛化。 OpenPrompt在{\ url {https://github.com/thunlp/openprompt}}上公开发布。

translated by 谷歌翻译

Neural-iLQR: A Learning-Aided Shooting Method for Trajectory Optimization

Zilong Cheng , Yulin Li , Kai Chen , Jun Ma , Tong Heng Lee

分类：机器学习 | 人工智能

2020-11-21

迭代线性二次调节器（ILQR）在解决非线性系统模型的轨迹优化问题方面已广泛普及。但是，作为一种基于模型的拍摄方法，它在很大程度上依赖于准确的系统模型来更新最佳控制动作和通过正向集成确定的轨迹，从而变得容易受到不可避免的模型的影响。最近，针对最佳控制问题的基于学习的方法进行的大量研究工作在解决未知系统模型方面已经取得了显着发展，尤其是当系统与环境具有复杂的相互作用时。然而，通常需要一个深层的神经网络来拟合大量的采样数据。在这项工作中，我们提出了神经-ILQR，这是一种在不受约束的控制空间上进行学习的拍摄方法，其中使用简单结构的神经网络代表局部系统模型。在此框架中，通过同时完善最佳策略和神经网络迭代，可以实现轨迹优化任务，而无需依靠系统模型的先验知识。通过对两项说明性控制任务的全面评估，在系统模型中存在不准确性的情况下，提出的方法显示出胜过常规ILQR。

translated by 谷歌翻译

Deep Model Assembling

Zanlin Ni , Yulin Wang , Jiangwei Yu , Haojun Jiang , Yue Cao , Gao Huang

分类：计算机视觉 | 人工智能 | 机器学习

2022-12-08

Large deep learning models have achieved remarkable success in many scenarios. However, training large models is usually challenging, e.g., due to the high computational cost, the unstable and painfully slow optimization procedure, and the vulnerability to overfitting. To alleviate these problems, this work studies a divide-and-conquer strategy, i.e., dividing a large model into smaller modules, training them independently, and reassembling the trained modules to obtain the target model. This approach is promising since it avoids directly training large models from scratch. Nevertheless, implementing this idea is non-trivial, as it is difficult to ensure the compatibility of the independently trained modules. In this paper, we present an elegant solution to address this issue, i.e., we introduce a global, shared meta model to implicitly link all the modules together. This enables us to train highly compatible modules that collaborate effectively when they are assembled together. We further propose a module incubation mechanism that enables the meta model to be designed as an extremely shallow network. As a result, the additional overhead introduced by the meta model is minimalized. Though conceptually simple, our method significantly outperforms end-to-end (E2E) training in terms of both final accuracy and training efficiency. For example, on top of ViT-Huge, it improves the accuracy by 2.7% compared to the E2E baseline on ImageNet-1K, while saving the training cost by 43% in the meantime. Code is available at https://github.com/LeapLabTHU/Model-Assembling.

translated by 谷歌翻译

AdaFocusV3: On Unified Spatial-temporal Dynamic Video Recognition

Yulin Wang , Yang Yue , Xinhong Xu , Ali Hassani , Victor Kulikov , Nikita Orlov , Shiji Song , Humphrey Shi , Gao Huang

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-27

最近的研究表明，减少时间和空间冗余都是有效的视频识别方法的有效方法，例如，将大多数计算分配给与任务相关的框架或每个帧中最有价值的图像区域。但是，在大多数现有的作品中，任何一种类型的冗余通常都是用另一个缺失建模的。本文探讨了在最近提出的ADAFOCUSV2算法之上的时空动态计算的统一配方，从而有助于改进的ADAFOCUSV3框架。我们的方法仅在一些小但有益的3D视频立方体上激活昂贵的高容量网络来降低计算成本。这些立方体是从框架高度，宽度和视频持续时间形成的空间中裁剪的，而它们的位置则以每样本样本为基础的轻加权政策网络自适应地确定。在测试时间，与每个视频相对应的立方体的数量是动态配置的，即，对视频立方体进行顺序处理，直到产生足够可靠的预测为止。值得注意的是，可以通过近似可插入深度特征的插值来有效地训练adafocusv3。六个基准数据集（即ActivityNet，FCVID，Mini-Kinetics，Something Something V1＆V2和潜水48）上的广泛经验结果表明，我们的模型比竞争性基线要高得多。

translated by 谷歌翻译

Incorporating Casual Analysis into Diversified and Logical Response Generation

Jiayi Liu , Wei Wei , Zhixuan Chu , Xing Gao , Ji Zhang , Tan Yan , Yulin Kang

分类：自然语言处理 | 人工智能

2022-09-20

尽管条件变异自动编码器（CVAE）模型比传统的SEQ2SEQ模型可以产生更多的多样化响应，但响应通常与输入词的相关性低或与问题不合逻辑。进行因果分析以研究背后的原因，并提供了一种寻找调解人并减轻对话中混杂偏见的方法。具体而言，我们建议预测调解人，以保留相关信息，并自动将调解人纳入生成过程中。此外，动态主题图指导条件变异自动编码器（TGG-CVAE）模型用于补充语义空间并减少响应中的混杂偏置。广泛的实验表明，所提出的模型能够产生相关和信息性的响应，并且在自动指标和人类评估方面优于最先进的响应。

translated by 谷歌翻译

A general class of combinatorial filters that can be minimized efficiently

Yulin Zhang , Dylan A. Shell

分类：机器人

2022-09-10

组合过滤器的状态最小化是一个基本问题，例如在建造廉价，资源有效的机器人中。但是，已知确切的最小化是NP-HARD。本文比到目前为止对这种硬度进行了更细微的分析，并发现了有助于这种复杂性的两个因素。我们表明，每个因素都是问题硬度的独特来源，因此能够阐明（1）图表的（1）编码兼容性关系的结构的作用，以及（2）确定性 - 实现约束。正如先前的一系列工作试图引入其他假设并确定导致实际状态减少的子类一样，我们接下来使用这种新的，更加清晰的理解来探索特殊情况，以便为哪些确切的最小化是有效的。我们引入了一种用于约束修复的新算法，该算法适用于大型滤波器，其中包含了三种不同的特殊情况，以前已知多项式时间最小化最小化的可能性。尽管这三种情况中的每一个中的效率都以前出现在看似不同的特性中，而当通过本工作的镜头看时，它们的共同点现在变得很清楚。我们还提供有效降低的全新过滤器家族。

translated by 谷歌翻译

Shifting Perspective to See Difference: A Novel Multi-View Method for Skeleton based Action Recognition

Ruijie Hou , Yanran Li , Ningyu Zhang , Yulin Zhou , Xiaosong Yang , Zhao Wang

分类：计算机视觉 | 机器学习

2022-09-07

基于骨架的人类行动识别是由于其复杂的动态而是一项长期挑战。动态的一些细颗粒细节在分类中起着至关重要的作用。现有的工作主要集中在设计带有更复杂的相邻矩阵的增量神经网络上，以捕获关节关系的细节。但是，他们仍然很难区分具有广泛相似运动模式但属于不同类别的动作。有趣的是，我们发现运动模式上的细微差异可以显着放大，并且可以轻松地通过指定的视图方向来区分观众，在这些方向上，该属性以前从未得到充分探索。与以前的工作截然不同，我们通过提出一种概念上简单而有效的多视图策略来提高性能，该策略从一系列动态视图功能中识别动作。具体而言，我们设计了一个新颖的骨骼锚定建议（SAP）模块，该模块包含一个多头结构来学习一组视图。为了学习不同观点的特征学习，我们引入了一个新的角度表示，以在不同视图下的动作转换并将转换归因于基线模型。我们的模块可以与现有的动作分类模型无缝合作。与基线模型合并，我们的SAP模块在许多具有挑战性的基准上展示了明显的性能增长。此外，全面的实验表明，我们的模型始终击败了最新的实验，并且在处理损坏的数据时保持有效和健壮。相关代码将在https://github.com/ideal-idea/sap上提供。

translated by 谷歌翻译